Telegram Group & Telegram Channel
Anthropic昨晚《反思我们的责任扩展政策》的文章,回顾了其责任扩展政策(Responsible Scaling Policy,RSP)的实施情况:

Anthropic在去年夏天首次发布了RSP,旨在应对前沿模型的灾难性安全故障和误用问题。该政策的主要目标是将高层次的安全概念转化为快速发展的技术组织的实际指南,并展示其作为可能标准的可行性。

在实施过程中,Anthropic发现拥有明确的灾难性风险政策非常有价值。而政策的实施需要Anthropic各团队的密切合作,特别是在红队测试和威胁建模与评估方面。通过这种合作,风险缓解目标得到了显著改善。

未来Anthropic计划更新其RSP,并将在不久后分享新的版本。确保未来的前沿模型在训练和部署过程中负责任地进行,将需要Anthropic及整个行业和政府的重大投资。

X

关注频道 @ZaiHuaPd
频道投稿 @ZaiHuabot
🫥会员/Apple/Plus券合集



tg-me.com/TestFlightCN/24977
Create:
Last Update:

Anthropic昨晚《反思我们的责任扩展政策》的文章,回顾了其责任扩展政策(Responsible Scaling Policy,RSP)的实施情况:

Anthropic在去年夏天首次发布了RSP,旨在应对前沿模型的灾难性安全故障和误用问题。该政策的主要目标是将高层次的安全概念转化为快速发展的技术组织的实际指南,并展示其作为可能标准的可行性。

在实施过程中,Anthropic发现拥有明确的灾难性风险政策非常有价值。而政策的实施需要Anthropic各团队的密切合作,特别是在红队测试和威胁建模与评估方面。通过这种合作,风险缓解目标得到了显著改善。

未来Anthropic计划更新其RSP,并将在不久后分享新的版本。确保未来的前沿模型在训练和部署过程中负责任地进行,将需要Anthropic及整个行业和政府的重大投资。

X

关注频道 @ZaiHuaPd
频道投稿 @ZaiHuabot
🫥会员/Apple/Plus券合集

BY 软件新闻频道📮投稿爆料




Share with your friend now:
tg-me.com/TestFlightCN/24977

View MORE
Open in Telegram


Testflight 新闻投稿 中文 Telegram | DID YOU KNOW?

Date: |

A project of our size needs at least a few hundred million dollars per year to keep going,” Mr. Durov wrote in his public channel on Telegram late last year. “While doing that, we will remain independent and stay true to our values, redefining how a tech company should operate.

The S&P 500 slumped 1.8% on Monday and Tuesday, thanks to China Evergrande, the Chinese property company that looks like it is ready to default on its more-than $300 billion in debt. Cries of the next Lehman Brothers—or maybe the next Silverado?—echoed through the canyons of Wall Street as investors prepared for the worst.

Testflight 新闻投稿 中文 from es


Telegram 软件新闻频道📮投稿爆料
FROM USA